Pandas 的 Dataframe 如何按某类特征分组?

您所在的位置:网站首页 pandas dataframe 建立 Pandas 的 Dataframe 如何按某类特征分组?

Pandas 的 Dataframe 如何按某类特征分组?

#Pandas 的 Dataframe 如何按某类特征分组?| 来源: 网络整理| 查看: 265

在Pandas中,您可以使用groupby方法将DataFrame按照某一列或多列的特征进行分组,然后对每个组进行聚合计算。

例如,假设您有一个DataFrame df,其中包含以下几列:A、B和C。要按照列A的值进行分组,您可以使用以下代码:

grouped = df.groupby('A')

这将返回一个GroupBy对象,您可以使用该对象的各种聚合方法来计算每个组的统计量。例如,要计算每个组的平均值,您可以使用以下代码:

grouped.mean()

您也可以将多个列用作分组特征。例如,如果您想按列A和列B的值对数据进行分组,您可以使用以下代码:

grouped = df.groupby(['A', 'B'])

同样,您可以使用该GroupBy对象的各种聚合方法对每个组进行聚合计算。

以下是一个随机生成DataFrame并按照其中一列进行分组的示例代码:

import pandas as pd import numpy as np # 随机生成一个DataFrame df = pd.DataFrame({ 'A': np.random.choice(['foo', 'bar', 'baz'], size=100), 'B': np.random.randint(1, 6, size=100), 'C': np.random.randn(100) }) # 按列'A'进行分组 grouped = df.groupby('A') # 计算每个组的平均值 means = grouped.mean() # 显示结果 print(means)

这段代码将生成一个包含100行和3列的DataFrame,其中列A是由三个字符串'foo'、'bar'和'baz'中随机选取的,列B是随机生成的1到5之间的整数,列C是随机生成的标准正态分布随机数。然后,代码将使用groupby方法按列A对DataFrame进行分组,并使用mean方法计算每个组的平均值。最后,代码将打印出每个组的平均值。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3